|
|
Registro Completo |
Biblioteca(s): |
Embrapa Agricultura Digital; Embrapa Agroenergia; Embrapa Unidades Centrais. |
Data corrente: |
15/08/2023 |
Data da última atualização: |
06/02/2024 |
Tipo da produção científica: |
Artigo em Periódico Indexado |
Autoria: |
VAZ, G. J.; VEIGA, P. H. R. da C. da; CALDAS, R. G.; VIDAL, W. C. L.; ASSIS, C. P. de; CORREA, J. L.; MOURA, M. F. |
Afiliação: |
GLAUBER JOSE VAZ, CNPTIA; PEDRO HENRIQUE RODRIGUES DA CUNHA DA VEIGA, IZAGRO; RAFAEL GOMES CALDAS, IZAGRO; WYVIANE CARLOS LIMA VIDAL, CNPAE; CRISTIANE PEREIRA DE ASSIS, SUCOM; JORGE LUIZ CORREA, CNPTIA; MARIA FERNANDA MOURA, CNPTIA. |
Título: |
Tratamento de texto extraído de livros digitais para a indexação em mecanismo de busca. |
Ano de publicação: |
2023 |
Fonte/Imprenta: |
Revista Ibero-americana de Ciência da Informação, v. 16, n. 2, p. 311-328, maio/ago. 2023. |
ISSN: |
1983-5213 |
DOI: |
https://doi.org/10.26512/rici.v16.n2.2023.42740 |
Idioma: |
Português |
Conteúdo: |
Este trabalho apresenta uma metodologia de tratamento dos textos extraídos dos livros digitais da Coleção 500 Perguntas 500 Respostas da Embrapa a fim de que seu conteúdo possa ser indexado e acessado via um mecanismo de busca específico. A metodologia envolve a extração dos elementos essenciais dos livros, como imagens e arquivos HTML, o pré-processamento desses elementos, sua análise e edição, e a construção de componentes adequados para sua indexação. Além de um intenso trabalho de análise humana, são consideradas tecnologias como o formato Epub para livros digitais, o editor Sigil, scriptspara processamento de texto, padrões web de representação e Elasticsearch. Experimentos mostram que a metodologia viabiliza a disponibilização de textos bem formatados para sua indexação e seu uso em mecanismos de busca, propiciando uma rica experiência ao usuário, além de possibilitar a construção de novas soluções digitais. Nesse contexto, a curadoria digital é fundamental para agregar valor aos recursos digitais e atender às necessidades específicas de seus usuários. |
Palavras-Chave: |
Curadoria digital; Digital books; Digital curation; Disseminação da informação; Indexação; Indexing; Livros digitais; Processamento de texto; Recuperação da informação; Text processing. |
Thesaurus Nal: |
Information dissemination; Information retrieval. |
Categoria do assunto: |
-- |
URL: |
https://ainfo.cnptia.embrapa.br/digital/bitstream/doc/1155913/1/AP-Tratamento-texto-2023.pdf
|
Marc: |
LEADER 02252naa a2200361 a 4500 001 2155913 005 2024-02-06 008 2023 bl uuuu u00u1 u #d 022 $a1983-5213 024 7 $ahttps://doi.org/10.26512/rici.v16.n2.2023.42740$2DOI 100 1 $aVAZ, G. J. 245 $aTratamento de texto extraído de livros digitais para a indexação em mecanismo de busca.$h[electronic resource] 260 $c2023 520 $aEste trabalho apresenta uma metodologia de tratamento dos textos extraídos dos livros digitais da Coleção 500 Perguntas 500 Respostas da Embrapa a fim de que seu conteúdo possa ser indexado e acessado via um mecanismo de busca específico. A metodologia envolve a extração dos elementos essenciais dos livros, como imagens e arquivos HTML, o pré-processamento desses elementos, sua análise e edição, e a construção de componentes adequados para sua indexação. Além de um intenso trabalho de análise humana, são consideradas tecnologias como o formato Epub para livros digitais, o editor Sigil, scriptspara processamento de texto, padrões web de representação e Elasticsearch. Experimentos mostram que a metodologia viabiliza a disponibilização de textos bem formatados para sua indexação e seu uso em mecanismos de busca, propiciando uma rica experiência ao usuário, além de possibilitar a construção de novas soluções digitais. Nesse contexto, a curadoria digital é fundamental para agregar valor aos recursos digitais e atender às necessidades específicas de seus usuários. 650 $aInformation dissemination 650 $aInformation retrieval 653 $aCuradoria digital 653 $aDigital books 653 $aDigital curation 653 $aDisseminação da informação 653 $aIndexação 653 $aIndexing 653 $aLivros digitais 653 $aProcessamento de texto 653 $aRecuperação da informação 653 $aText processing 700 1 $aVEIGA, P. H. R. da C. da 700 1 $aCALDAS, R. G. 700 1 $aVIDAL, W. C. L. 700 1 $aASSIS, C. P. de 700 1 $aCORREA, J. L. 700 1 $aMOURA, M. F. 773 $tRevista Ibero-americana de Ciência da Informação$gv. 16, n. 2, p. 311-328, maio/ago. 2023.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
URL |
Voltar
|
|
Registros recuperados : 9 | |
3. | | VIEIRA, A. de F. M.; FALCAO, R.; JUNGMANN, L.; SANTANA, H.; GARCIA, L. C.; VIDAL, W. C. L. Método para avaliação qualitativa do acúmulo de amido intracelular na microalga Chlorella sorokiniana. In: ENCONTRO DE PESQUISA E INOVAÇÃO DA EMBRAPA AGROENERGIA, 7., 2023, Brasília, DF. Anais... Brasília, DF : Embrapa, 2023. p. 19.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Agroenergia. |
| |
5. | | GOMES, J. B. V.; BARRETO, A. C.; MICHEREFF FILHO, M.; VIDAL, W. C. L.; COSTA, J. L. da S.; OLIVEIRA-FILHO, A. T. de; CURI, N. Relações entre atributos do solo e atividade de formigas em restingas. Revista Brasileira de Ciência do Solo, v. 34, p. 67-78, 2010.Tipo: Artigo em Periódico Indexado | Circulação/Nível: A - 2 |
Biblioteca(s): Embrapa Florestas. |
| |
6. | | GOMES, J. B. V.; BARRETO, A. C.; MICHEREFF FILHO, M.; VIDAL, W. C. L.; COSTA, J. L. da S.; OLIVEIRA-FILHO, A. T. de; CURI, N. Relações entre atributos do solo e atividade de formigas em restingas. Revista Brasileira de Ciência do Solo, v. 34, p. 67-78, 2010.Tipo: Artigo em Periódico Indexado | Circulação/Nível: B - 1 |
Biblioteca(s): Embrapa Tabuleiros Costeiros. |
| |
7. | | MELLO, A. A. C. de; ARZABE, C.; VIDAL, W. C. L.; FRANCO, P. C. R.; HAMMES, V. S.; ALVES, H. M. R. Cocreation, validation and feedback: innovation in the e-book Women in coffee in Brazil. In: ARZABE, C.; COSTA, V. C. (ed.). Gender equality: contributions of Embrapa. Brasília, DF: Embrapa, 2020. E-book. (Sustainable development goal, 5).Tipo: Capítulo em Livro Técnico-Científico |
Biblioteca(s): Embrapa Solos. |
| |
8. | | MELLO, A. A. C. de; ARZABE, C.; VIDAL, W. C. L.; FRANCO, P. C. R.; HAMMES, V. S.; ALVES, H. M. R. Cocriação, validação e realimentação: inovações no e-book Mulheres dos cafés no Brasil. In: ARZABE, C.; COSTA, V. C. (Ed.). Igualdade de gênero: contribuições da Embrapa. Brasília, DF: Embrapa, 2018. cap. 7. E-book. (Objetivos de Desenvolvimento Sustentável, 5).Tipo: Capítulo em Livro Técnico-Científico |
Biblioteca(s): Embrapa Solos. |
| |
9. | | VAZ, G. J.; VEIGA, P. H. R. da C. da; CALDAS, R. G.; VIDAL, W. C. L.; ASSIS, C. P. de; CORREA, J. L.; MOURA, M. F. Tratamento de texto extraído de livros digitais para a indexação em mecanismo de busca. Revista Ibero-americana de Ciência da Informação, v. 16, n. 2, p. 311-328, maio/ago. 2023.Tipo: Artigo em Periódico Indexado | Circulação/Nível: B - 3 |
Biblioteca(s): Embrapa Agricultura Digital; Embrapa Agroenergia; Embrapa Unidades Centrais. |
| |
Registros recuperados : 9 | |
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|